"""
对缺失数据不敏感,算法简单,常用于文本分类,速度快,准确
缺点: 假设样本属性相互独立,所以特征属性有关联时,效果不好
准确率: 84.21%
朴素: 假定了特征之间相互独立
拉普拉斯平滑系数
"""
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB

# 1 获取数据
iris = load_iris()
# 2 划分数据集
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)
# 3 贝叶斯
estimator = MultinomialNB()
estimator.fit(x_train,y_train)
# 4 模型评估
score = estimator.score(x_test,y_test)
print(score)
